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考虑 可 变 环境 因素 的 公共 自行 车 短期 需求 预测 模型 
乔 “ 健 '， 陈 少 博 ， 何 梦 莹 


(西北 工业 大 学 管理 学 院 ,， 西安 710072) 


摘 要 : 现 有 公共 自行 车 短期 需求 预测 模型 忽视 了 不 同 环境 因素 影响 用 户 需 求 的 性 质 差异 和 可 变 环境 因素 的 时 间 
依赖 性 。 将 环境 因素 区 分 为 已 内 化 于 需求 的 不 变 因素 和 需要 单独 考虑 的 可 变 因素 ， 提 出 一 种 用 图 卷 积 神 经 网 络 
(GCNN) 捕 获 用 户 需 求 的 非 欧 式 空间 依赖 、 用 长 短期 记忆 (LSTM) 网 络 捕获 用 户 需 求 和 可 变 环境 因素 的 时 间 依 赖 、 通 
过 向 量 拼接 和 全 连接 网 络 将 可 变 环境 因素 的 影响 施加 于 用 户 需求 的 GCNN-LSTM-E 模型 。 实 验 结果 显示 ，GCNN- 
LSTM-E 模型 在 1h 时 间 粒 度 下 的 预测 性 能 最 优 ， 而 且 优 于 所 有 基准 模型 的 预测 性 能 。 说 明 该 模型 的 设计 合理 有 效 
lh 是 最 合适 的 时 间 粒 度 。 

关键 词 : 公共 自行 车 ; 短期 需求 预测 ; 图 卷 积 神 经 网 络 ; 长 短期 记忆 
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Short-term demand prediction model for public bikes considering variable environmental factors 


Qiao Jiani, Chen Shaobo, He Mengying 
(School of Management, Northwestern Polytechnical University, Xi'an Shaanxi 710072, China) 


Abstract: Existing short-term demand prediction models for public bikes ignored the difference in the nature of the impacts 
of different environmental factors on user demand as well as the temporal dependency of variable environmental factors. this 
paper distinguished environmental factors into the invariable factors that have been internalized into user demand and the 
variable factors that need to be considered separately, and then proposed a model called GCNN-LSTM-E in this paper. In the 
model, this paper used graph convolutional neural network (GCNN) to capture the non-euclidean spatial dependency of user 
demand, used long short-term memory (LSTM) network to capture the temporal dependencies of user demand and variable 
environmental factors, and applied vector concatenation and fully connected network to impose the influence of variable 
environmental factors on user demand. Experimental results showed that the GCNN-LSTM-E model has the best prediction 
performance and outperforms all benchmark models under lh time granularity. It indicates that the design of the model is 
reasonable and effective, and 1h is the most appropriate time granularity. 

Key words: public bike; short-term demand prediction; graph convolutional neural network; long short-term memory 


0 引言 两 者 都 需要 人 工 识别 隐藏 在 原始 数据 中 的 特征 。 
本 基于 深度 神经 网 络 (deep neural network，DNN) 的 ML 模 

随 着 机 动车 数量 快速 增长 ， 全 球 众 多 城市 因 交 通 拥堵 、 型 一 一 深度 学 习 (deep learning，DL) 模 型 ， 不 仅 能 自动 提取 
环境 污染 和 能 耗 压力 越 来 越 大 ， 开始 积极 地 选择 大 力 发 展 公 ”隐藏 特征 031， 而 且 学 习 和 记忆 能 力 更 强 ， 近 年 成 为 交通 预 
共 交 通 。 公 共 自 行车 绿色 、 节 能 、 在 满足 “最 初 /最 后 。 测 领 域 的 主流 模型 。Zhang 等 人 04 最 早 提出 公共 自行 车 短期 
一 公里 ”、 站 es 短途 通勤 等 方面 发 挥 着 重要 作用 。 公 ”需求 预测 DL 模型 ， 试 图 用 卷 积 神经 网 络 (convolution neural 
共 自 行车 系统 (public bike system， py 向 交通 系统 ， 用 network，CNN) 捕 获 用 户 需 求 的 空间 和 时 间 依 赖 。 基 于 欧式 
户 经 常 在 不 同 站 点 租 /还 自行 车 ， 很 容易 出 现 站 点 库存 失衡 、 空间 计算 卷 积 是 CNN 擅长 图 像 识别 的 重要 原因 ， 但 公共 上 
需求 满足 率 大 幅 下 降 的 问题 ， 因 此 必须 提前 预测 短期 需求 ， 行车 需求 的 空间 依赖 并 非 欧式 关系 ， 而 且 CNN 没有 记忆 过 
J 平衡 各 站 点 库存 ， 才 能 避免 出 现 前 述 情况 。 可 见 ， 公 ”去 的 机 制 ， 因 此 并 不 擅长 捕获 事务 的 时 间 依 赖 。 
共 自 行车 短期 需求 预测 是 非常 重要 的 公共 交通 研究 课题 。 从 循环 神经 网 络 (recurrent neural network，RNN) 发 展 而 

照 空间 粒度 ， 可 将 公共 自行 车 短期 需求 分 为 城市 级 、 来 的 长 短期 记忆 (long short-term memory，LSTM) 和 门 控 循 环 
集群 级 和 站 点 级 帆 。 城 市 级 和 区 域 级 短期 需求 确定 性 强 ， 预 单元 (gated recurrent unit，GRU)， 是 专 为 捕获 事务 的 时 间 依 
测 难 度 较 小 ， 但 预测 结果 不 能 直接 作为 站 点 库存 再 平衡 的 依 。 赖 而 设计 的 DNN， 最 近 几 年 受到 了 交通 预测 领域 的 关注 。 
据 。 站 点 级 短期 需求 随机 性 强 ， 预 测 难度 较 大 ， 但 预测 结果 比如 ，Wang 等 人 (5 分 别提 出 支持 单 时 间 步 输出 的 公共 自行 
可 以 直接 用 于 再 平衡 站 点 库存 。 站 点 级 预测 模型 包括 统计 模 短期 需求 预测 LSTM 模型 和 GRU 模型 ，Liu 等 人 09 进 
型 和 机 器 学 习 (Machine Learning，ML) 模 型 两 类 。 常 见 的 统 步 提 出 支持 多 特性 输入 和 多 时 间 步 输出 的 LSTM 模型 ， 许 夭 
计 模 型 有 贝 叶 斯 网 络 外 、 自 回归 移动 平均 加、 多 元 回归 多、 等 人 07 针对 出 行 分 布 的 非 严 格 周 期 性 ， 提 出 引入 注意 力 机 
泊 松 和 负 二 项 式 回 归 忠 等， 传统 的 机 器 学 习 模 型 有 支持 向 量 制 的 共享 单车 短期 需求 预测 AM-LSTM 模型 ， 刘 耿耿 等 人 [5] 
机 四、 梯度 提升 树 由 、 随 机 森林 咏 2 和 神经 网 络 避 国 等 。 统 提出 输出 层 与 向 前 隐藏 层 和 向 后 隐藏 层 同时 连接 的 共享 单车 
计 模 型 更 容易 解释 ， 传 统 的 ML 模型 预测 能 力 更 强 。 不 过 ， 短期 需求 预测 双向 LSTM 模型 。LSTM、GRU 等 DNN 虽然 

收 稿 日 期 : 2022-01-20; 修 回 日 期 : 2022-03-14 基金 项 目 : 国家 自然 科学 基金 资助 项 目 (71971171) 


作者 简介 : 乔 健 (1965-)， 男 (通信 作者 )， 江 苏 宝 应 人 ， 副 教授 ， 硕 导 ， 主要 研究 方向 为 数据 挖 据 、 交 通 管理 (qiaojian@Onwpu.edu.cn); 陈 少 博 
(2001-)， 男 ， 河 南 洛阳 人 ， 硕 十 研究生， 主要 研究 方向 为 数据 挖 据 、 交 通 预 测 ; 何 梦 营 (1999-)， 女 (回族 )， 宁 夏 平 罗 人 ， 硕 士 研究 生 ， 主 要 研究 方向 为 
数据 挖 据 、 交 通 预 测 . 


录用 定稿 


最 近 兴 起 的 图 


十 获 事 务 的 时 间 依 赖 ， 但 不 擅长 
卷 积 神经 网 络 (GCNN)09 基 于 非 欧 式 空间 


乔 ” 健 等: 考虑 可 变 环境 因素 的 公共 自行 车 短期 需求 预测 模型 


获 事务 的 空间 依赖 。 


图 卷 积 ， 与 公共 


夺 向 


分 别 
赖 和 
天 和 
的 空 
素 与 
人 
注意 
用 一 
然 很 
一 样 


户 需 


用 多 


变 的 
比如 


用 LSTM 


时 间 依 赖 ; 
周三 种 时 间 
间 和 时 间 依 赖 ， 


力 卷 积 
个 全 连接 神 


取代 CNN 成 为 设计 公共 
流 DNN 之 一 。 比 如 ， 在 Xiao 等 人 [2 
用 GCNN 和 门 CNN(gated CNN) 捕 获 | 
在 Kim 等 人 P20 提 出 的 模型 
粒度 的 GCNN 的 结 


全 连接 层 输 出 的 加 权 和 作为 模型 
J 提 出 的 模型 中 ， 
经 网 络 (GACNN) 捕 获 不 
经 网 络 
符合 用 户 需求 在 空间 


自行 车 需求 的 空间 依赖 特征 完全 一 致 ， 
行车 短期 需求 预测 模型 的 主 
提出 的 STGCN 模型 中 
户 需求 的 空间 依 


中 ， 试 图 通过 时 、 


,之 间 租 车 和 还 车 需求 的 相关 度 。 假 设 用 
X=. 表示 时 雍 
并 表示 上 时 刻 站 点 立 的 用 


ChinaXiv 合 作 期 刊 


第 


39 卷 第 8 期 


户 需求 为 时 间 序 列 


需求 特征 提 


接 前 馈 块 构成 ， 用 于 
GCNN 卷 积 块 负责 
序列 bs 中 


合 ， 同 时 捕获 用 户 需 求 
并 将 天 气 和 时 段 (工作 日 /周末 ) 等 环境 医 


运算 结果 输出 


的 预测 结果 ; 在 He 
用 注意 力 机 制 与 GCNN 结合 的 多 个 图 
同时 间 粒 度 的 车 流 ， 
入 天 气 和 兴趣 点 的 影响 。GCNN 虽 
依赖 上 的 非 欧式 特点 ， 但 与 CNN 


， 不 擅长 


个 GCNN 分 别 


屠 肯 


0 学校、 


气温 、 降 雨 、 


有 获 用 户 需求 的 时 
提出 GCNNree-DDGF 模型 ,分别 用 GCNN 和 LSTM 捕获 用 
求 的 空间 和 时 间 


间 依 赖 。 为 此 ，Lin 等 人 [1 


依赖 ，Chai 等 人 [3 提出 MGCNN 模型 
i 获 站 点 之 间 的 距离 、 交 互 和 相关 关系 ， 


i 获 多 图 卷 积 计算 结果 中 的 时 间 依 赖 。 

用 户 需求 受到 很 多 环境 因素 的 影响 ， 其 中 有 些 因 素 是 不 
， 车 站 、 超 市 等 兴趣 点 ， 有 些 因 
风力 等 天 气 状 况 。 事 实 上 ， 不 变 环境 因素 


素 是 变化 的 ， 


是 长 


期 存在 的 ， 


其 影响 


已 内 化 于 用 户 需求 ， 因 此 ， 构 建 预测 


chinaXiv:202204.00053v1 


模型 
未 内 
则 可 
素 ， 


了 不 变 和 可 变 环境 因素 影响 | 
环境 因 素 ， 不 仅 重 复 ， I 


引入 


时 不 应 再 考虑 
化 于 用 户 需 求 ， 


3 


能 影响 预测 精度 。 目 


可 变 环境 因素 是 临时 存在 的 ， 其 影响 并 
因此 ， 构 建 预测 模型 时 应 单独 考虑 ， 否 
前 ， 大 多 数 模 型 都 没有 考虑 环境 因 


少数 考虑 ] 


了 一 些 不 变 ] 


环境 因素 的 模型 又 存在 以 下 问题 : 


一 是 忽视 


算出 A > 

LSTM 
户 需求 的 时 
为 短期 状态 太 
输出 


的 部 分 ， 输 出 
针对 来 


户 需 求 的 性 质 差异 ， 不 必要 地 
且 增 加 了 模型 的 结 


构 复 
了 这 


杂 度 和 时 间 


种 环境 因素 的 时 
本 文 提出 一 种 只 


模型 
捕获 
存在 


器 组 


户 需 


， 人 朴 


杂 度 ; 


用 GCNN 捕获 用 


二 是 静态 看 待 可 变 环境 因素 ， 忽 视 
间 依 赖 性 。 
考虑 可 变 环境 因素 的 GCNN-LSTM-E 
户 需求 的 非 欧 式 空间 依赖 ， 用 LSTM 


的 上 述 问题 ， 


用 户 需求 和 可 变 环境 因素 的 时 间 依 赖 ， 解 决 了 现 有 模型 
提高 了 模型 的 预测 性 能 。 


GCNN-LSTM-E 模型 设计 


该 模型 


需求 特征 捕获 器 、 环 境 特征 捕获 器 和 特 4 


E 融 合 


成 ,其 


架构 见 图 


求 的 变化 规律 


1。 需 求 特 征 捕获 器 负责 学 习 、 记 忆 用 
以 及 时 间 和 空间 依赖 特性 ， 环 境 特征 捕 


获 器 负责 学 习 、 记 忆 可 变 环境 因 
特征 融合 器 负责 将 可 变 环 


性 ， 


素 的 变化 规律 和 时 间 依 赖 特 
户 需求 相 融 合 ， 以 


卉 因素 与 用 


反映 前 者 对 后 者 的 影响 。 


1.1 


可 以 


点 集合 ， 


LSTM 细 胞 : : LSTM 细 胞 


| | 


LSTM 细 胞 | : [LsrM 细 胞 


时 
拼接 块 


需求 特征 排 获 器 


特征 融合 器 | 环境 特征 捕获 器 


图 1 


Fig. 1 


GCNN-LSTM-E 模型 架构 


Architecture of the GCNN-LSTM-E model 


需求 特征 捕获 器 


用 


用 户 需求 既 有 空间 依赖 性 又 有 时 间 依 赖 性 ， 
是 非 欧式 的 ， 即 站 点 间 
图 G=W,4) 表示 这 种 关系 ， 其 中 ， 
4=[ajJeRw 表示 邻接 矩阵 ， 


有 空间 依赖 
的 OD 关系 是 非 对 称 的 多 对 多 关系 ， 

V={y,…vw} 表示 站 
Qj 表示 站 点 与 站 点 


和 计算 细 
入 门 、 
[,] 表示 


de 
t 


全 连 


LH Dd N 
出 3% eR”,， 


过 下 列 步 又 初始 化 趾 ; 
2) 令 4=4+m ， 其 中 心 是 单 
其 中 DeRww 是 


和 长 
遗忘 门 控制 上 一 
的 部 分 ， 输 入 
门 控制 er 中 应 该 输出 到 
自 GCNN 卷 积 块 的 输入 Axss,,.…,Axs ， 
遗忘 门 fr*、 输 出 门 f 和 细胞 状 


中 or 控制 。 


在 当前 时 刻 被 遗弃 


用 式 (1)~(6) 更 新 输入 门 访 、 
态 必 的 同时 ， 计 算 短 期 六 
用 户 需求 的 时 间 依 赖 ， 这 是 


其 中 ，W;、 Wi 、 
胞 状态 时 
忘记 门 、 
向 量 拼接 ， 
表示 S 型 函数 和 双 


户 需求 。 


胞 的 


di; =2 ,a 组 成 的 对 
循环 块 负责 从 输入 时 间 序列 hes saaxr 中 
间 依 赖 。LSTM 旨 


期 状态 of 


1N 个 站 点 的 


户 需 求 ， 


自 算 


结构 如 图 2 所 示 ， 其 输 昌 


? 


时 刻 


遗忘 门 拼 、 输 入 门 评 参 


的 长 期 状态 


ie 的 部 分 。 


RR 态 序列 及 40…h eR% ， 从 而 


LSTM 


有 获 器 由 GCNN 卷 积 块 、LSTM 循环 块 和 全 连 
捕获 用 户 需 求 的 空间 和 时 间 依 赖 。 
通过 图 卷 积 运算 xs hx ， 从 输入 时 间 
获 用 户 需求 的 非 欧 式 空间 依赖 ， 然 后 将 
| LSTM 循环 块 。 其 中 ， 有 为 图 过 滤器 ， 通 
1) 随机 生成 一 个 实 对 称 邻接 矩阵 4; 

们 入 


E 阵 ;3) 通过 4=p-4D+ 计 


阵 。 


获 用 


Tl 


cs 中 应 该 


门 控制 条 中 应 该 添加 到 er 


胞 


有 获 


有 的 d 表示 隐藏 单元 的 数量 。 


i =o(W, [ha ,Ax ]+b) 
fr =o(W [hs, Axs]+b,) 


or =o(W, [hs, Axs]+b,) 
Ga =tanh(W. [hss, Ax*]+b.) 
=f OS+ 访 Or 


hs =ox Otanh(c*) 


W, 、 
的 权重 和 矩 
输出 


Fig. 


1.2 环境 特征 捕获 器 


该 部 件 
可 变 环境 因 


依赖 。 影 


W. 分 别 为 输入 门 、 


车， b; 、 


Fs 


门 和 计算 细胞 状态 时 的 1 


© 表示 逐 元 素 相 乘 ， 
正切 函数 


o 


LSTM 循环 块 和 全 连接 前 馈 
素 的 时 间 


向 用 


舌 兴 趣 点 、 


天 气 状况 和 空气 


~、 


大 


里 。 


b,、b,、b 


o 


o() 和 和 


图 2 LSTM 细胞 的 结构 
2 Structure of a LST™M cell 
交 前 馈 块根 据 LSTM 循环 块 的 隐藏 状态 不 计算 输 


(1) 
Q) 
G3) 
(4) 
(5) 
(6) 


忘记 门 、 输 出 门 


-分别 为 输 


局 置 项 癌 量 ， 


tanh() 分 别 


即 用 户 需 求 的 预测 结果 (引入 可 变 环境 


央 构 成 ， 


户 需 求 的 环境 因素 主要 


对 素 前 )。 


于 捕获 


兴趣 点 属于 不 变 环境 攻 


天 气 状况 和 空气 质量 属于 可 变 ; 


环境 因素 。 本 文 认为 ， 不 变 ; 


境 因素 长 


基 存 在 ， 


其 影响 已 内 


化 于 


降雨 和 空气 质量 等 可 变 环 


卉 大 


为 此 ， 在 模型 中 单独 考虑 这 些 


的 气温 、 


风力 、 


获 器 用 其 LSTM 循环 块 捕获 | 
其 LSTM 
并 据 此 计算 隐藏 状态 序列 ip s 
素 的 时 间 依 赖 ， 这 里 的 心 表示 隐藏 单元 的 数量 。 


特征 捕获 器 


境 医 


紊 。1 


降雨 和 空气 质 


因素 。 
量 组 成 上 


循环 


j 户 需求 上 


户 需 求 ， 气 温 、 风 力 、 
备 时 的 ， 其 影响 并 未 内 


限 设 xm eR* 


9 向 量 。 与 需求 特征 捕 
9 时 间 依赖 类 似 ， 环 
央 接 收 输入 时 间 序列 


化 
表示 1 时 刻 
捕 
卉 


en en 
XI-TH Nt 9 


Re ， 从 而 


i 获 可 变 环 


全 连接 前 馈 块 根据 LSTM 循环 块 的 隐藏 状态 入 计算 输 
出 总 eR”， 即 可 变 环境 因素 的 预测 结果 ， 其 中 M 表示 可 变 
环境 因素 的 数量 。 
1.3 ”特征 融合 器 
该 部 件 由 拼接 块 和 全 连接 前 馈 块 构成 ， 用 于 将 可 变 环境 
对 素 的 影响 施加 在 各 站 点 的 用 户 需 求 上 。 拼 接 块 负责 将 各 站 
点 的 用 户 需 求 的 预测 结果 下 , 与 可 变 环境 因素 的 预测 结果 
各 拼接 成 NN 个 长 度 为 M+1 的 向 量 总 4 =, 识 ] ， 这 些 向 量 
构成 矩阵 总 =[3%0… 吏 mJ ， 表 示 将 M 种 可 变 环境 因素 的 影 
响 施加 于 N 个 站 点 的 用 户 需 求 上 。 前 馈 块 负责 用 公式 
ya=i 六 计算 可 变 环境 因素 影响 下 的 用 户 需求 的 预测 结 
果 》 ， 其 中 Wi 是 长 度 为 M+1 的 权重 向 量 。 在 模型 训练 阶 
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的 站 点 每 小 时 平均 租 / 还 车 需求 不 足 3.75 个 。 
表 1 累计 需求 的 统计 性 描述 


Tab. 1 Statistical description of cumulative demand 
指标 租车 需求 还 车 需求 
均值 98787 98669 
标准 差 66880 67733 
最 小 值 26429 20337 
0 分 位 数 46324 45918 
中 位 数 75682 74398 
上 四 分 位 数 137882 138721 
最 大 值 469548 465854 
本 文 还 用 网 络 仆 虫 抓 取 了 与 需求 数据 时 间 段 相同 的 纽约 


i 
段 ， 用 绝对 值 损失 函数 es= 开 -za 计算 % 与 真实 需求 


每 天 的 气温 、 风 力 、 降 水 量 和 空气 质量 数据 ， 并 将 这 些 数 据 


yi 间 的 误差 ， 用 Adam 优化 器 [e 更 新 各 权重 矩阵 和 偏 置 项 


与 不 同时 间 粒 度 下 的 需求 数据 在 时 间 上 相对 应 。 


向 量 。 为 防止 训练 模型 时 过 拟 合 ， 预 先 指定 迭代 阔 值 s。 在 
验证 集 上 训练 模型 时 ， 如 果 训 练 过 程 迭 代 * 次 后 ， 预测 精度 
仍 未 提高 ， 就 结束 训练 ， 并 将 此 时 的 模型 作 ， 
2 ”数值 实验 
2.1 数据 准备 

本 文 用 纽约 PBS 的 数据 集 验 证 本 文 模型 。 该 数据 集 的 
时 间 跨 度 为 2017 年 1 月 1 日 至 2019 年 12 月 31 日 ,包含 4 
千 多 万 条 真实 交易 记录 。 本 文 对 原始 数据 做 如 下 预 处 理 形成 
实际 需求 数据 : 先 筛选 出 3 年 一 直 存 在 的 站 点 ， 再 统计 这 些 
站 点 每 小 时 的 平均 租 / 还 车 需求 ， 从 中 剔除 每 小 时 平均 租 /还 
车 需求 小 于 1 个 的 站 点 后 剩余 395 个 站 点 ， 累 计时 长 26280 


为 最 终 模型 返回 。 


2.2 评价 指标 

本 文 用 均 方 根 误 差 RMSE(Root Mean Square Error)、 平 
均 绝 对 误差 M4E(Mean Absolute Error) 和 判定 系数 
R2*(Coefficient of Determination) 衡 量 模型 的 预测 精度 ， 它 们 
的 计算 公式 如 下 : 


1 法 二 有 
A i Da 2 (yi — Vis) (7) 
1 M CN 、 
MAb Dl EE ,| (8) 
- ee 0) 
“ Dl 


小 时 。 图 3 所 示 为 这 些 站 点 每 小 时 平均 租 /还 车 需求 分 布 情 
况 ， 其 中 ， 左 图 为 按 递增 顺序 排列 的 租车 需求 分 布 ， 左 图 为 
与 左 图 排列 顺序 一 致 的 还 车 需求 分 布 。 可 以 看 到 ， 不 同 站 点 
的 需求 变化 很 大 ， 但 同一 站 点 的 却 非 常 接近 。 从 后 面 的 图 4 
可 以 看 到 ，3 种 时 间 粒 度 的 实际 需求 曲线 均 较 平滑 。 图 3 和 
图 4 说 明 ， 绝 大 多 数 出 行为 往返 交通 且 确定 性 很 强 。 无 同类 
竞争 干扰 是 需求 稳定 的 主要 原因 ， 也 是 本 文选 择 该 数据 集 的 
原因 | 。 


0 50 300 


0 50 100 150 200 250 300 350 400 


站 点 序号 

图 3 395 个 站 点 的 平均 租 /还 车 需求 分 布 

Fig.3 Distribution of average rental/return demands for 395 stations 
表 1 为 395 个 站 点 累计 需求 的 描述 性 统计 。 根 据 租 /还 

车 需求 均值 可 以 推算 出 ， 平 均 每 个 站 点 每 小 时 大 约 有 3.75 

个 租 /还 车 需求 。 从 中 可 以 看 出 ， 租 /还 车 需求 的 最 小 值 和 最 

大 值 差 距 很 大 ， 大 多 数 站 点 的 租 / 还 车 需求 很 小 ， 一 半 以 上 


其 中 ，M 表示 时 长 ，N 表示 站 点 数量 ， 癌 、 和 分 别 表示 站 
点 i 在 上 时 刻 的 预测 值 和 真实 值 ，3 表 示 平 均值 。RMSE、 
MAE 和 R? 都 反映 了 预测 值 与 真实 值 之 间 的 误差 情况 。 对 了 
相同 的 数据 ， 用 不 同 量 纲 表 示 时 的 RMSE、M4E 和 R? 是 不 
同 的 。 用 同 组 数据 预测 时 ，RMSE 和 MA4E 的 值 越 小 预测 效 
果 越 好 ，R? 的 值 越 大 预测 效果 越 好 。 
2.3” 超 参数 
本 文 用 网 格 搜 索 法 优化 超 参数 ， 即 人 工 指 定 超 参数 的 搜 
索 空 间 并 穷 举 搜索 。 搜 索 空间 用 “开始 : 步 长 :结束 ”表示 ， 比 
如 “12:12:36” 表 示 搜 索 空间 为 {12,24,36}。 在 验证 数据 集 上 ， 
以 M4E 作为 模型 的 评价 指标 ， 以 确定 超 参 数 的 最 优 值 。 
GCNN-LSTM-E 模型 有 3 类 超 参数 ，1) 需求 特征 捕获 器 和 
环境 特征 捕获 器 中 循环 块 的 时 间 步 数 7、 需 求 特征 捕获 器 中 
LSTM 细胞 内 的 隐藏 单元 数 4 、 环 境 特 征 捕获 器 中 LSTM 纪 
包 内 的 隐藏 单元 数 心 ; 2) Adam 算法 的 学 习 率 x 和 最 小 批 处 
理 规 模 下 ;3) 模型 训练 过 程 的 友人 代 阔 值 *。 
本 文 把 需求 数据 集 按时 间 顺 序 分 为 训练 集 、 验 证 集 和 测 
试 集 ， 其 中 ， 验 证 集 和 测试 集 各 8 周 ， 其 余 为 训练 集 。 然 后 
用 网 格 搜索 法 得 到 超 参 数 的 搜索 空间 、 最 优 值 及 评价 指标 ， 
如 表 2 所 示 。 
表 2 超 参 数 的 搜索 空间 、 最 优 值 及 GCNN-LSTM-E 模型 的 评价 指标 
Tab.2 Search space and optimal value of the hyperparameters, as well 
as evaluation index of the GCNN-LSTM-E model 


nm 


uy 
o 


MAE 
T di d» a 游 S 
12:12:36 25:25:200 25:25:200 .001:.001:.015 20:20:200 10:10:100 及 
24 100 100 0.001 40 10 


2.4 实验 结果 

本 文 与 8 种 基准 模型 进行 了 预测 性 能 对 比 ， 这 些 模型 分 
别 为 HA( 历 史 平 均 ) 模 型 、GCNNree-DDGF( 数 据 驱 动 的 图 
卷 积 神经 网 络 ) 模 型 罚 的 线性 回归 ) 模 


I 、LASSO( 带 1- 范 数 惩 
型 、LSTM( 长 短期 记忆 ) 模 型 、MLP( 多 层 感知 器 ) 模 型 、 


SVR-linear( 
RBF( 


误差 见 表 3。 可 以 看 到 ， 


LL 有线 拆 


E 核 函数 的 支持 


有 径 向 基 核 函数 的 
度 提 升 回归 树 ) 模 型 。 


9 种 模型 在 1h 时 间 粒 


支持 向 量 


乔 ” 健 ， 等; 


向 量 回归 ) 模 型 、SVR- 
归 ) 模 型 和 XGBoost( 梯 


度 下 租车 需求 测试 集 上 实验 的 预测 
HA 模型 


寻思 想 过 于 简单 而 性 能 表 


所 示 。 在 lh 时 间 粒 度 下 ，GCNN-LSTM-E 模型 的 6 个 
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指标 


均 领 先 ; 在 0.5h 时 间 粒 度 下 ，GCNN-LSTM-E 模型 的 4 个 指 


标 领 9 


先 ，2 个 指标 持平 ; 
LSTM-E 模型 的 2 个 指标 领先 ， 
后 ， 说 明 GCNN-LSTM-E 模型 


粒度 下 ，GCNN- 
1 个 指标 持平 ，3 个 指标 落 
总 体 明 显 优 于 GCNNree-DDGF 


在 0.25h 时 间 


现 最 差 '，SVR-linear 模型 和 LASSO 模型 凭借 回归 技术 显著 模型 ， 引 入 可 变 环境 因素 的 时 间 依 赖 ， 确 提高 了 前 者 的 预测 
提升 了 性 能 ， 但 线性 核 函 数 导 致 其 性 能 虽 强 于 MA 模型 但 弱 性 能 。 
于 其 他 模型 ，SVR-RBF 模型 采用 非 线 性 核 函 数 ， 因 而 性 能 从 式 (7)、 式 (8) 和 式 (9) 可 知 ，RMSE 和 M4 与 自 变 量 的 
超越 了 SVR-linear 模型 和 LASSO 模型 ，MLP 模型 凭借 深度 量 纲 有 关 ， 与 自 变 量 的 量 纲 无 关 。 也 就 是 说 ， 不 同时 间 
神经 网 络 在 性 能 上 超越 了 SVR-RBF 模型 ，LSTM 模型 通过 粒度 下 的 及 能 够 直接 比较 ， 所 以 ， 可 以 确定 表 4 中 1h 时 间 
捕获 需求 序列 的 时 间 依 赖 使 性 能 比 MLP 模型 有 所 提升 ; 粒度 下 的 R? a 但 是 ， 不 同时 间 粒 度 下 的 RMSE 和 MAE 
XGBoost 模型 通过 支持 微调 和 增加 正则 化 参数 以 控制 过 拟 合 ， ”不 能 直接 比较 ， 所 以 ， 无 法 确定 表 4 中 哪 种 时 间 粒 度 下 的 
而 获得 比 LSTM 模型 更 强 的 性 能 ，GCNNiee-DDGF 模型 通过 ”RMSE 和 MAE 最 好 。 
甫 获 用 户 需 求 的 时 空 依赖 ， 而 获得 比 XGBoost 模型 明显 更 表 4 在 3 种 时 间 粒 度 下 租 /还 车 需求 测试 集 上 的 预测 误差 
强 的 性 能 ，GCNN-LSTM-E 模型 不 仅 能 捕获 用 户 需 求 的 时 空 Tab.4 Experimental results on the rental/return demand test datasets 
依赖 ， 而 且 考 虑 了 可 变 环境 因素 的 时 间 依 赖 ， 而 获得 比 under three kinds of time granularities 
GCNNiee-DDGF 模型 更 强 的 性 能 。 在 还 车 需求 测试 集 上 的 实 模型 时 间 粒 度 租车 需求 还 车 需求 
验 结果 与 上 述 类 似 ， 不 再 歼 述 。 RMSE MAE 尼 RMSE MAE R’ 
表 3 在 1h 时间 粒 度 下 租车 需求 测试 集 上 的 预测 误差 1h 2.80 1.71 0.73 2.80 1.69 0.75 
Tab.3 Prediction errors on the rental demand test dataset under the GCNN-LSTM-E 0.5h 1.93 1.28 0.66 1.91 1.28 0.69 
time granularity of 1h 0.25h 1.27 0.85 0.14 1.27 0.83 0.21 
模型 RMSE MAE R? 1h 2.89 1.73 0.72 2.87 1.71 0.74 
GCNN-LSTM-E 2.80 1.71 0.73 GCNNiee-DDGF 0.5h 1.94 1.30 0.66 1.93 1.29 0.69 
GCNNiee-DDGF 2.89 1.73 0.72 0.25h 1.26 0.85 0.15 1.26 0.84 0.20 
XGBoost 3.31 1.98 0.65 3 种 时 间 粒 度 下 纽约 PBS 的 实际 需求 和 GCNN-LSTM-E 
LST™ 3.35 1.98 0.64 模型 的 预测 需求 如 图 4 所 示 。 可 以 看 到 ， 时 间 粒 度 越 细 ， 
MLP 3.42 2.07 0.62 GCNN-LSTM-E 模型 的 预测 精度 越 低 ， 就 是 说 ， 表 4 中 1h 
SVR-RBF 3.64 2.16 0.59 时 间 粒 度 下 的 RMSE 和 MAE 最 好 ， 预 测 精度 最 高 。 原 因 可 
LASSO 3.68 2.27 0.58 能 在 于 ， 时 间 单 位 越 小 ， 用 户 需 求 的 随机 性 越 强 、 波 动 性 越 
SVR-linear 3.71 2.08 0.57 大 ， 导 致 模型 的 预测 精度 越 低 。 因 此 ， 从 兼顾 平衡 站 点 库存 
HA 4.69 2.86 0.34 和 提高 预测 精度 的 角度 看 ，1h 是 比 0.5h 和 0.25h 更 合适 的 时 
GCNN-LSTM-E 模型 和 GCNNree-DDGF 模型 在 1h、0.5h ” 间 粒 度 。 其 他 模型 的 实验 结果 与 表 4 和 图 4 的 规律 一 致 ， 不 
和 0.25h 时 间 粒 度 下 租 / 还 车 需求 数据 集 上 的 预测 误差 如 表 4 再 效 述 。 


租车 需求 ( 辆 ) 
名 
s 


一 一 实际 需求 一 一 实际 需求 
一 一 GCNN-LSTW-E 5000 一 一 GCNN-LSTM-E 
_ 4000 
得 
悦 3000 
避 2000 
1000 
0 
0 25 50 75 100 125 150 175 0 25 50 75 100 125 150 
时 间 (1h) 时 间 (1h) 
3000 一 一 实际 需求 
一 一 | GcNN-LSTWE 一 一 GCNN-LSTWE 
2500 
嫩 2000 
并 
庚 1500 
以 1000 
500 
0 
0 50 100 150 200 250 300 350 0 50 100 150 200 250 300 350 
时 间 (0. 5h) 时 间 (0. 5h) 
一 一 实际 需求 一 一 实际 需求 
一 一 GCNN-LSTM-E 1750 一 一 GCNN-LSTW-E 
1500 
霹 1250 
搓 1000 
骨 
考 750 
ba 
500 
250 
0 
0 100 200 300 400 500 600 700 0 100 200 300 400 500 600 700 
时 间 (0. 25h) 时 间 (0. 25h) 
sa ne 此 而 测 | 二 求 
图 4 3 种 时 间 粒 度 下 纽约 PBS 的 实际 需求 和 GCNN-LSTM-E 模型 的 预测 需求 


Fig.4 Actual demand of New York PBS and predicted demand of the GCNN-LSTM-E model under three kinds of time granularities 


录用 定稿 乔 
3 ”结束 语 


公共 自行 车 是 一 种 单 向 交通 工具 ， 因 此 ， 站 点 库存 再 平 
衡 对 确保 系统 服务 高 水 平 运转 非常 关键 。 准 确 预 测 用 户 的 短 
期 需求 是 准确 再 平衡 站 点 库存 的 前 提 条 件 ， 然 而 ， 大 多 数 现 
有 短期 需求 预测 模型 未 考虑 环境 因素 的 影响 ， 少 数 模 型 则 忽 
视 了 不 变 和 可 变 环境 因素 影响 用 户 需求 的 性 质 差 异 、 以 及 可 
变 环境 因素 的 时 间 依 赖 性 。 本 文 提 出 一 种 只 考虑 可 变 环境 因 


R 


素 、 用 GCNN 捕获 用 户 需 求 的 非 欧式 空间 依赖 、 用 LSTM 
捕获 用 户 需求 和 可 变 环境 因素 的 时 间 依 赖 、 通 过 向 量 拼接 和 


全 连接 网 络 将 可 变 环境 因素 的 影响 施加 于 用 户 需 求 的 
GCNN-LSTM-E 模型 ， 并 在 3 种 时 间 粒 度 下 ， 用 真实 的 需求 
数据 和 可 变 环境 数据 进行 了 该 模型 与 8 种 基准 模型 的 预测 性 
能 对 比 。 结 果 显 示 ， 在 1h 时 间 粒 度 下 ，GCNN-LSTM-E 模 
型 的 预测 性 能 最 优 ， 而 且 优 于 8 基准 模型 的 预测 性 能 ， 说 明 
本 文 模型 的 设计 合理 有 效 。 而 且 ， 从 兼顾 平衡 站 点 库存 和 提 
高 预测 精度 的 角度 看 ，1h 是 最 合适 的 时 间 粒 度 。 
据 了 解 ， 纽 约 PBS 没有 任何 同类 竞争 者 ， 而 众多 中 国 
城市 的 PBS 要 面 喻 罗 、 美 团 、 青 村 等 共享 单车 的 激烈 竞争 。 
不 同市 场 竞争 环境 下 ， 用 户 需 求 的 稳定 性 自然 不 同 。 本 文 模 
型 仅 在 需求 很 稳定 的 纽约 PBS 数据 集 上 进行 了 测试 ， 今 后 
有 必要 收集 更 多 不 同市 场 竞争 环境 下 的 PBS 数据 集 ， 以 对 


于 


互 


本 文 模型 的 普 适 性 进行 进一步 的 深入 研究 。 此 外 ， 突 发 事件 
引发 的 需求 突变 也 是 模型 应 用 时 面临 的 难点 。 
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